Вы хотите сделать регрессию, которая будет предсказывать вероятность задержки рейса. В ваших данных есть рейсы со слишком большой и редкой задержкой — до 12 часов. Это портит вашу модель. Как бы вы решали проблему?
Есть несколько вариантов действий,
✔️Исключить выбросы. Можно удалить наблюдения, если они слишком редкие. Но перед этим следует провести статистический анализ, чтобы убедиться, что задержки превышают определённый порог, скажем, 95-й или 99-й процентиль. ✔️Сделать модель более устойчивой к выбросам. Тут можно: ▫️применить регуляризацию ▫️взять другой алгоритм, например деревья решений. ▫️использовать метрики, устойчивые к выбросам: MAE или функцию потерь Хьюбера вместо MSE. ✔️Преобразовать данные. Можно использовать, например, логарифмическое преобразование.
Вы хотите сделать регрессию, которая будет предсказывать вероятность задержки рейса. В ваших данных есть рейсы со слишком большой и редкой задержкой — до 12 часов. Это портит вашу модель. Как бы вы решали проблему?
Есть несколько вариантов действий,
✔️Исключить выбросы. Можно удалить наблюдения, если они слишком редкие. Но перед этим следует провести статистический анализ, чтобы убедиться, что задержки превышают определённый порог, скажем, 95-й или 99-й процентиль. ✔️Сделать модель более устойчивой к выбросам. Тут можно: ▫️применить регуляризацию ▫️взять другой алгоритм, например деревья решений. ▫️использовать метрики, устойчивые к выбросам: MAE или функцию потерь Хьюбера вместо MSE. ✔️Преобразовать данные. Можно использовать, например, логарифмическое преобразование.
#машинное_обучение
BY Библиотека собеса по Data Science | вопросы с собеседований
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
That strategy is the acquisition of a value-priced company by a growth company. Using the growth company's higher-priced stock for the acquisition can produce outsized revenue and earnings growth. Even better is the use of cash, particularly in a growth period when financial aggressiveness is accepted and even positively viewed.he key public rationale behind this strategy is synergy - the 1+1=3 view. In many cases, synergy does occur and is valuable. However, in other cases, particularly as the strategy gains popularity, it doesn't. Joining two different organizations, workforces and cultures is a challenge. Simply putting two separate organizations together necessarily creates disruptions and conflicts that can undermine both operations.
Telegram is riding high, adding tens of million of users this year. Now the bill is coming due.Telegram is one of the few significant social-media challengers to Facebook Inc., FB -1.90% on a trajectory toward one billion users active each month by the end of 2022, up from roughly 550 million today.
Библиотека собеса по Data Science | вопросы с собеседований from tr